2025.10.29 | 通义深度研究报告；小模型折记忆胜671B巨模型

Update: 2025-10-29

Description

本期的 10 篇论文如下：

[00:23 ] 🔍 Tongyi DeepResearch Technical Report（通义深度研究报告：面向长程深度信息检索任务的智能体大模型）

[01:00 ] 🧠 AgentFold: Long-Horizon Web Agents with Proactive Context Management（AgentFold：面向长程任务的主动式上下文管理智能体）

[01:36 ] 🤖 RoboOmni: Proactive Robot Manipulation in Omni-modal Context（RoboOmni：全模态上下文下的主动机器人操作）

[02:33 ] 🎮 Game-TARS: Pretrained Foundation Models for Scalable Generalist Multimodal Game Agents（Game-TARS：面向可扩展通才多模态游戏智能体的预训练基础模型）

[03:05 ] 🎬 Uniform Discrete Diffusion with Metric Path for Video Generation（面向视频生成的度量路径均匀离散扩散模型）

[03:42 ] 🛠 OSWorld-MCP: Benchmarking MCP Tool Invocation In Computer-Use Agents（OSWorld-MCP：评测计算机代理调用MCP工具能力的基准）

[04:28 ] 🎨 Group Relative Attention Guidance for Image Editing（基于群组相对注意力引导的图像编辑方法）

[05:14 ] 🚀 WebLeaper: Empowering Efficiency and Efficacy in WebAgent via Enabling Info-Rich Seeking（WebLeaper：通过富信息搜索赋能网络智能体效率与效能）

[06:04 ] 🧭 Routing Matters in MoE: Scaling Diffusion Transformers with Explicit Routing Guidance（MoE路由关乎成败：显式路由引导扩散Transformer扩容）

[07:01 ] 🧠 ParallelMuse: Agentic Parallel Thinking for Deep Information Seeking（并行缪斯：面向深度信息搜寻的主体化并行思考）

</figure>

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

Comments

In Channel

2025.10.29 | 通义深度研究报告；小模型折记忆胜671B巨模型

2025-10-2908:14

2025.10.28 | Point Transformer无标对齐长空间；代码递归统一粗细粒度

2025-10-2811:05

2025.10.27 | DeepAgent一步推理+ToolPO；视频即提示DiT秒控百种语义

2025-10-2710:29

【周末特辑】10月第4周最火AI论文 | 内部概率+投票剪尾，RPC省样本提精度

2025-10-2613:26

2025.10.24 | AdaSPEC挑40% token提速两成；AutoPage 10美分生成交互网页

2025-10-2410:39

2025.10.23 | 线性注意力显存降十倍；动态裁剪PPO稳提分

2025-10-2310:46

2025.10.22 | LightMem压缩记忆千倍提速12倍；闭环世界模型微调8万数据反超巨兽

2025-10-2211:14

2025.10.21 | 模型不懂光影折射；小模型也能写报告

2025-10-2110:06

2025.10.20 | RPC剪枝提速保准；OmniVinci小数据跨模态称王

2025-10-2011:11

【周末特辑】10月第3周最火AI论文 | 量化噪声变探索，单卡跑RL；冻结编码器放语义，DiT生成新纪录

2025-10-1813:30

2025.10.17 | AI眼镜预判式服务；视频生成补想象力

2025-10-1708:40

2025.10.16 | UniMoE一统语音音乐；注意力图点亮大模型推理

2025-10-1610:13

2025.10.15 | 像素级自监督ViT刷新生成基准；多智能体评测网文翻译新标尺

2025-10-1510:38

2025.10.14 | 量化误差变奖励，单卡训32B；面向多模态大模型的音视频评测基准

2025-10-1411:24

2025.10.13 | 桌面交互预训练解锁机器人潜能；统一模型赋予相机空间想象力

2025-10-1310:10

【周末特辑】10月第2周最火AI论文 | 递归小模型刷爆推理榜；未来经验点亮零奖励学习

2025-10-1211:39

2025.10.10 | 早期经验的Agent Learning；图文交错反思链跃升至24.9%

2025-10-1010:00

2025.10.09 | Ming-UniVision统一视觉词表；KV-Cache直连让大模型秒聊

2025-10-0911:46

2025.10.08 | TaTToo用外挂代码干翻大模型；4B小模型32步逼近闭源巨头

2025-10-0811:16

2025.10.07 | 论文秒变演讲；Video-LMM后训练突破

2025-10-0711:02

00:00

2025.10.29 | 通义深度研究报告；小模型折记忆胜671B巨模型

#box-pro-ellipsis-176179715225363{-webkit-line-clamp:2;}2025.10.29 | 通义深度研究报告；小模型折记忆胜671B巨模型

2025.10.29 | 通义深度研究报告；小模型折记忆胜671B巨模型

2025.10.29 | 通义深度研究报告；小模型折记忆胜671B巨模型